Guia de Programação AMD HIP: Fundamentos Arquitetônicos do Ecossistema HIP

O Ecossistema HIP é arquitetado como uma camada de abstração leve projetada para compatibilidade de código-fonte entre arquiteturas AMD e NVIDIA. Ele utiliza o ROCm (Radeon Open Compute) pilha, especificamente utilizando o Arquitetura de Sistema Heterogêneo (HSA) tempo de execução e o Driver de Fusão de Núcleos (KFD).

1. Inicialização de Arranque

A inicialização começa com trocas de mensagens de baixo nível entre drivers de kernel via hsa_init(0, ...) e hsaKmtOpenKFD(...). Essas chamadas de estabelecimento criam a ponte de comunicação entre aplicações no espaço de usuário e o hardware da GPU AMD.

2. Descoberta de Topologia e Propriedades

Antes de iniciar núcleos, o tempo de execução identifica as capacidades do hardware usando hsaKmtAcquireSystemProperties e hsaKmtGetNodeProperties. Ele mapeia a memória física para nós da GPU usando hsaKmtMapMemoryToGPUNodes, garantindo visibilidade da tabela de páginas para o dispositivo.

3. A Pipeline de Compilação

A ponte entre CUDA e HIP é construída sobre dois pilares: hipify-perl (transpilador baseado em expressões regulares) e hipcc (envoltório de compilador).

# Exemplo de Fluxo de Portabilidade
hipify-perl square.cu > square.cpp
hipcc square.cpp -o square.out

4. Lógica de Versão

A compatibilidade é garantida por meio de uma fórmula precisa para assegurar que hipRuntimeGetVersion esteja alinhado com as tabelas de extensão HSA:

$$\text{HIP\_VERSION} = \text{MAIOR} \times 10^7 + \text{MENOR} \times 10^5 + \text{CORREÇÃO}$$

TERMINALbash — 80x24

> Ready. Click "Run" to execute.

QUESTION 1

Which tool converts CUDA (.cu) files into HIP-ready C++ (.cpp) files via regex mapping?

hipcc

hipify-perl

hsa_init

rocminfo

QUESTION 2

What is the primary purpose of the Kernel Fusion Driver (KFD) in this architecture?

To compile device-side ISA code.

To manage user-space to GPU communication and page table mapping.

To calculate the HIP_VERSION macro.

To provide high-level math intrinsics.

QUESTION 3

Given the formula, what is the value of HIP_VERSION for major version 6, minor 0, and patch 325?

600325

60032500

60000325

60032500 (6*10^7 + 0*10^5 + 325)

QUESTION 4

Which low-level HSA function must be called to establish the system-wide runtime context?

hsa_init(0, ...)

hsaKmtAllocMemory(...)

hsaKmtCreateEvent(...)

hsa_agent_iterate_is_pas(...)

QUESTION 5

What does hsa_system_get_major_extension_table do?

It links HIP API calls to the specific HSA implementation on the host.

It converts CUDA code to C++.

It allocates 4096-byte buffers.

It releases KMT system properties.